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формування онтологічних баз знань. Детально розглянуто один з підкласів онторедакторів -- онтокоректори, 
показано їх місце в процесі створення онтології, основні задачі, особливості впровадження, практичні 
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Статья посвящена вопросу создания и практического использования специализированньх утилит в процессе 
формирования онтологических баз знаний. Подробно рассмотрен один из подклассов онторедакторов - 
онтокорректорь, показано их место в процессе создания онтологий, основньюе задачи, особенности 
внедрения, практические и методологические рекомендации по использованию. 

Ключевьге слова: онтокорректор, онтология украйнского язьгка, создание онтологий. 


Вступ 


Одним з ключових моментів створення лінгвістичної онтології є етап розробки спе- 
ціалізованого програмного забезпечення для аналізу та редагування її даних. Найбільш 
поширеним типом програмного забезпечення для виконання такої роботи з обробки знань 
є онторедактори. Детальні огляди утиліт даного класу можна знайти у роботах |1-41. 
У загальному випадку онторедактори дозволяють модифікувати більшу частину харак- 
теристик онтології, серед них: редагувати концепти, змінювати зв'язки між концеп- 
тами, видозмінювати структуру онтології, обирати мову представлення знань та навіть 
створювати нові онтології. 
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Онтокоректори -- це підклас онторедакторів, спеціалізований для аналізу та адапта- 
ції знань онтології. Створення знань та внесення змін в онтологічну базу вимагає вико- 
ристання утиліт цього класу. Під адаптацією ми будемо розуміти процес створення нової 
онтології на основі вже існуючої. Класичний приклад - створення онтологій для євро- 
пейських мов у проекті Еиго У огаМеї | 5| та створення онтологій балканських мов у проек- 
ті ВаїкаМеї |6) на основі лексико-семантичної англомовної бази знань У/огаМе! |7|. 
Аналогічні дослідження з адаптації англомовних знань УМ/огаїеї та їх внугрішньої струк- 
тури до української мови ми проводимо в проекті ОЛУМ |8|. Архітектура, модель 
представлення знань, методи доступу до онтології, а також інші деталі створеної україно- 
мовної лексичної бази знань описано в роботі |9). 

Перші спроби зі створення україномовної онтології нами проводилися ще у 2005 -- 
2006 роках, отриманий за час проекту досвід вказав на необхідність систематизації та 
автоматизації деяких елементів процесу. Як відповідь на ці потреби було розроблено 
нову модель представлення знань та створено ряд спеціалізованих утиліт для проведен- 
ня роботи з наповненням онтології, ключову роль серед яких відіграє онтокоректор. 

Робота над онтокоректором нами проводиться з 2010 року, загалом система прой- 
шла шлях від версії 0.1 до 1.55 (актуальна на момент написання статті версія додатку). 
Протягом цього часу нові версії системи з'являлися на сайті проекту ОМ/М (10) та про- 
ходили практичні випробування серед користувачів, що допомагають нам створювати 
онтологію. На даний момент робота над створенням онтології ще триває, проте практичний 
досвід вже сьогодні дозволяє стверджувати: в процесі адаптації онтології одне з клю- 
чових місць має займати створення онтокоректора. Далі в статті ми розглянемо деякі 
особливості створення та використання утиліти цього типу. 

У проекті |ЛУМ онтокоректор виконує широкий перелік функцій, серед них: 

- забезпечення користувачів інтерфейсом до знань онтології, підтримка процесів 
видачі, редагування та збереження інформації; 

- підтримка циклічних процесів зміни стану знань після редагувань та перевірок; 

- забезпечення послідовного редагування знань без виникнення колізій у великій 
кількості паралельних редакторських та модераторських сесій; 

-- перевірка коректності введених даних, у тому числі орфографічна перевірка; 

- персоналізація оброблених даних -- кожен набір змін має свого власника. 

Використання онтокоректора дозволило проводити одночасну роботу з наповнення 
онтології великої кількості людей без додаткового розподілу синсетів між виконавцями, 
тобто редактор може обрати для роботи будь-який синсет, а система автоматично додасть 
до синсета дані про автора. 

Подальше редагування синсету, аж до остаточного затвердження в якості корект- 
ного, може проводити лише його автор. Також функціонал онтокоректора використо- 
вується в розробленій нами схемі адаптації даних англомовної онтології, що передбачає 
багаторівневу модель уточнення даних, для перевірки якості створених редакторами 
знань. 

На першому етапі дані синсету перекладаються автоматично; на другому етапі 
ці дані редагує людина з правами редактора; після закінчення роботи редактора, 
на третьому етапі, синсет перевіряється модератором; фінальна перевірка даних про- 
водиться адміністратором. 

Онтокоректор використовується на другому та третьому етапах роботи над синсетом. 
Затверджені адміністраторами синсети використовуються на етапі валідації онтології 
з метою виявлення порушень та неточностей у структурі її знань. 
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І Принципи створення 


«ОЛУМ:Коректор» є одним з прикладних додатків до системи |ЛУМ - проекту зі 
створення та покращення україномовної онтології на базі М/огаМеї. Детальний аналіз 
вимог показав, що для побудови системи найбільш вдало можна використати дворівневу 
клієнт-серверну архітектуру. Основна мета системи - надати користувачам можливість 
роботи з онтологічними даними з БД ОЛУМ. 


1.1 Структура серверної частини системи С УУМ 


Основними структурними елементами для розміщення логіки та даних в СУБД 
Огасіе виступають схеми. Кожна схема може містити таблиці з даними, модулі з програм- 
ною логікою, окремі процедури та функції, користувацькі типи даних, тригери та меха- 
нізми запуску процесів за розкладом. Крім того, кожна схема може мати свої політики 
безпеки та доступу до об'єктів інших схем. Основні елементи програмної логіки та збе- 
реження даних УМ, а також зв'язки між ними показано на рис. 1. Більш детальний 
огляд серверної організації (ЛУМ можна знайти в статті |9|. 


его огідіоду 


Рисунок 1 - Схема взаємодії основних структурних елементів |ЛУМ 


Розглянемо призначення ключових блоків: 

- ца рис - технологічна схема, що використовується як єдина точка для підклю- 
чення клієнтів і зовнішніх систем до БД ЛУМ. Тобто, схема ца яцезі, що виконує роль 
буферної зони для системи безпеки; 

- ца 5есигйу - схема, що відповідає за аутентифікацію систем, що підключають- 
ся до ОМУМ, визначення набору повноважень та надання прав доступу відповідно до 
профілю системи-додатку. Також дана схема виконує роль єдиного інтеграційного вузла 
доступу до всіх внутрішніх інтерфейсів ГЛУМ (серверної логіки), що здійснює обробку 
та модифікацію даних онтологічної та морфологічної баз. Додатково, для підвищен- 
ня рівня безпеки системи, схема містить механізми логування доступів (включаючи 
час, ІР-адресу та інші характеристики машини-клієнта) та логування списку команд, 
що виконує додаток. Дії користувача також відслідковуються 1 запам'ятовуються іншими 
модулями БД, задля забезпечення контролю цілісності даних і для відновлення пошкод- 
жених даних; 

- иа отоїіору - схема, що зберігає інформацію про наповнення україномовної онто- 
логії та містить серверну логіку для роботи з даними онтології (пошук та отримання да- 
них синсету, зміна даних синсету); 

- еп отоіору - схема, що зберігає інформацію про наповнення англомовної онто- 
логії (аналогічна до ца опіоїору); 
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- иа а(о - схема, що використовується для розміщення різноманітних семантичних 
алгоритмів та серверної логіки лінгвістичних додатків, а також програмно-алгоритміч- 
них частин лінгвістичних наукових досліджень (наприклад, програмних реалізацій 
методів визначення міри семантичної зв'язності та схожості); 

- ца тогрпоїору - схема, що зберігає морфологічний словник української мови 
та методи перевірки правопису. 


1.2 Механізм взаємодії клієнта і сервера 


Захист системи орієнтовано на уникнення неавторизованого доступу до даних онто- 
логії. Механізм взаємодії клієнтського додатку з серверною частиною |ЛУМ містить 
наступні кроки: 

1) для встановлення з'єднання з серверною частиною |ЛУМ клієнтський додаток 
входить до системи через технологічний аккаунт на ?иезі і отримує право доступу 
до схеми ца 5есигіїу для подальшої ідентифікації; 

2) додаток проводить виклик процедур аутентифікації схеми ша 5есикійу та прохо- 
дить реєстрацію в системі. Після успішної реєстрації клієнт отримує права на роботу 
з об'єктами |ЛУМ у відповідності до профілю додатку; 

3) за умови успішно виконаного другого кроку система-додаток отримує права на 
виклик певної підмножини процедур та функцій з інших схем системи: на опіоїору, 
еп опіоїору, ца аю, ца тогрПоїору та інших; 

4) на четвертому кроці відбувається безпосередня робота додатку з 0 М/М, що 
може складатися як з виклику окремих лінгвістичних функцій, так 1 з взаємодії з пакета- 
ми серверної логіки (наприклад, таким чином побудовано системні утиліти). 


1.3 Принципи організації роботи клієнтського додатку 
коректора 


Види робіт у системі та права доступу користувачів регулюються спеціальними 
профілями, які зберігаються на сервері. При вході до системи користувач ідентифі- 
кується за допомогою логіну та паролю, після валідації сервером даних і аутентифікації 
в системі, клієнт отримує дані про рівень доступу, у відповідності з яким надається 
доступ до функціоналу клієнтського додатку. В залежності від профілю користувачі 
можуть мати право на: 

- читання (тільки перегляд даних); 

- редагування (можна вносити зміни до деяких полів); 

- модерація (перевірка правильності, оцінка якості синсету, повернення на 
доопрацювання). 

Кожен наступний рівень доступу включає в себе всі права та можливості поперед- 
ніх рівнів. Для вирішення задач з покращення якості онтології система надає користу- 
вачу можливість перебирати синсети, слова яких містять помилки. При виборі такого 
синсету додаток виводить на користувацьку форму наступні дані: 

- повний список слів, які входять до синсету; 

-- глосарій синсету (опис або смислове значення); 
- номер синсету; 

- поточна статистика користувача; 

- інша інформація. 

Виводяться як україномовний варіант синсету, доступний для редагування, так 
і його англомовний відповідник, що використовується у якості основи для перекладу. 
Слова синсету та слова з опису, що мають орфографічні помилки (відсутні у стандартно- 
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му словнику української мови), виділяються червоним кольором. Внесені зміни 
користувач може зберегти до БД, після чого автоматично отримує наступний синсет 
з помилками. 

Важливим моментом при обробці синсету є встановлення міток коректності. Ре- 
дактори можуть встановлювати мітки коректності для частин синсету (опис та слова), 
якщо вважають, що всі помилки в цих полях було виправлено. Модератори, окрім зміни 
даних міток, мають можливість встановлювати додаткові: 

- «затверджено» - вказує на правильність перекладу синсету, проставляється у ви- 
падку, коли український варіант синсету повністю відповідає англійському оригіналу, 
синсет більше не надходить в обробку редакторам; 

- «забраковано» - вказує на невідповідність між українським варіантом синсету 
та англійським оригіналом, необхідне доопрацювання редактором. 

Схематичне зображення сценаріїв використання системи наведено на рис. 2. 
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Рисунок 2 - О5е-саз5е діаграма |ЛУМ. 
Зображено основні сценарії поведінки користувачів 


1.4 Реалізація клієнтського додатку коректора 


Клієнт відповідає за відокремлення логіки з БД та відображення інформації, тобто 
реалізує користувацький інтерфейс. Основні класи клієнтського додатку - це Мапає»ег, 
Зупзей та Мога. 

Мапаєег відповідає за керування станом поточної сесії: статистика ї дані профілю 
користувача, дані про з єднання з сервером, поточна частина мови, вказівник на поточ- 
ний синсет. Надає програмний інтерфейс до основних функцій сесії і запитів до БД: 
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- з'єднання з БД; 

- авторизація 1 реєстрація користувача у системі; 

- запит на отримання статистики користувача; 

-- перехід до наступного синсету (з БД надходить ідентифікатор поточного синсету, 
який передається в конструктор Зупзеї, де вичитуються дані синсету з БД); 

- збереження поточного синсету; 

- запит на перевірку орфографії. 

Зупзеє інкапсулює дані, що описують наповнення синсету: номер-ідентифіка- 
тор, частина мови, укр./англ. список слів, укр./англ. глосарії та спеціальні поля: мітки 
коректності та коментарі користувачів. Містить методи управління даними полями, 
у тому числі методи додавання, вилучення та відновлення слів україномовного синсету 
(всі маніпуляції проводяться на стороні клієнта 1 зберігаються в БД лише при виконан- 
ні відповідного виклику). Також реалізовано методи для отримання даних синсету з БД 
та збереження змін на сервері. 

УУога містить дані про слово синсету: ідентифікатор слова, мова, власне слово, 
мітки коректності 1 спеціальне бінарне поле і5РДеїєгеа, що має стани «вилучено» та «не 
вилучено» (зі списку слів синсету). Також має методи, що надсилають до БД запити 
на збереження 1 видалення слова. 

Запити до БД в останніх двох класах як правило збігаються у часі зі створенням 
чи знищенням об'єкта класу. Тому всі проміжні зміни, внесені користувачем, і початко- 
ва конфігурація синсету, зберігаються на клієнтському рівні, що забезпечує можливості 
відміни редагування (функціональність додано у версії 1.4). 

За відображення інформації і можливості редагування відповідає клас головної 
форми з деякими додатковими класами. Даний клас реалізує наступні функції: 

- виділення помилок у полях, доступних для редагування, на основі результатів 
орографічної перевірки, здійсненної на стороні сервера; 

- підтримка стеку дій користувача для відміни 1 повтору внесених змін; 

- інформування користувача та реакція на виключні дії (ехсеріоп5) та помилки 
при роботі з БД; 

- управління сесією (вхід, вихід, зміна користувача); 

- правила доступу до функціонала в залежності від профілю користувача. 

Користувацький інтерфейс додатку складається з двох основних форм: форма вхо- 
ду та робоча форма. Робоча форма |ЛУМ версії 1.55 представлена рис. 3. 

У процесі розвитку та доопрацювання системи, за рекомендаціями користувачів, 
було додано наступні можливості: 

- функціональність додавання 1 видалення слів з синсету, що пов'язано з відсут- 
ністю однозначного відображення між англійською та українською мовами; 

- виділення орфографічних помилок; 

- обмін повідомленнями між редактором 1 модератором, для проведення дискусій 
над помилками; 

- інтерфейс визначення коректності слів було змінено на більш дружній для кори- 
стувача; 

- функціональність відновлення початкового стану синсету. 

З системи було виключено надання орфографічних підказок через затримки 
при зверненні до сервера, де виконувався пошук схожих за написанням слів. 

У наступних версіях клієнту плануються наступні зміни і доповнення: 

-- зміна навігаційної частини - замість послідовного перебору, список доступних 
синсетів (що особливо важливо для використання додатку в рамках профілю «Читач»); 
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- можливість переглядати контекстно-семантичну інформацію, щодо поточного 
синсету, його зв'язки з іншими синсетами, місце в таксономічній ієрархії, тощо; 

- покращення системи обміну повідомленнями; 

- покращення інформативності форми; 

- оптимізація роботи з БД. 


| є 
Є ЧА Опіоіоду Соттесііоп СІепі 1.55 носи чСен |і 
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Рисунок 3 - Головна форма 0 МУМ:Коректора 1.55 


2 Використання додатку в процесі адаптації онтології 


Онтокоректор працює таким чином, що одразу після входу в систему редактор 
отримує синсет для роботи. Синсет, який було опрацьовано певним редактором, закрі- 
плюється за ним, подальші зміни в синсет може вносити тільки редактор-власник та 
модератор, що перевіряє даний синсет. Для опрацювання система видає користувачу 
в першу чергу ті синсети, що належать даному редактору 1 знаходяться в стані «неко- 
ректно», коли власні синсети редактора закінчуються, система видає користувачу нові 
синсети, що нікому не належать. 


2.1 Редагування 


При редагуванні синсету існує ряд чітких вимог, виконання яких забезпечує належ- 
ну якість роботи: 

1. Україномовний глосарій повинен описувати те ж саме поняття, що і англомовний. 
Глосарій повинен бути узгодженим за відмінкам, родами і числами. Також глосарій 
синсету може містити приклади використання поняття, що описується синсетом, 
наприклад: 

Англійський глосарій: «а питап Беїпе; "Шеге угаз оо тисП /ог опе рег5оп о ао"» 

Український глосарій: «людина; "це було забагато, щоб виконати одній людині "» 
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2. Список слів україномовного синсету є аналогом списку слів англомовного син- 
сету. Всі слова обов'язково повинні бути або синонімами, або близькими за змістом 
поняттями, що відповідають опису в глосарії. Крім цього, всі слова одного синсету мають 
належати до однієї частини мови. Всього в онтології присутні синсети чотирьох типів: 
іменники, дієслова, прикметники та прислівники. Зрозуміти, до якої частини мови 
належить синсет, можна за глосарієм. Наприклад, вище було наведено глосарії синсе- 
тів-іменників. Також в синсетах можуть зустрічатися слова, які перекладаються виключ- 
но у вигляді словосполучень. Наприклад: 

Англійський глосарій: «а ІПуіпе огеапізт спатасіегігей Бу уоЇипіату тоуетепі» 

Англійське слово: «апітате Реїпе» 

Український глосарій: «живий організм, що характеризується свідомим рухом» 

Українське слово: «жива істота» 

3. Допускається два варіанти написання словосполучень: через пропуск та через 
нижнє підкреслення, проте рекомендовано використовувати пропуск. Словосполучен- 
ня потрібно використовувати тільки в тому випадку, якщо не існує можливості описати 
поняття одним словом. Наприклад: 

ріапі Їйе - рослинне жсиття 

пашта! обіесі - природний об'єкт 

пиїіепі - поживна речовина 

4. Окрема увага приділяється тому, щоб словосполучення не перетворювалися 
на речення, особливо на складні речення з різними типами зворотів. Наприклад: 

особа, яка укладає документи - укладач документів 

той, хто проголошує тост - проголошувач тосту 

Марія, королева Шотландії - королева Шотландії Марія 

Після закінчення роботи над синсетом редактор має зберегти зміни. Синсет 
вважається повністю обробленим, якщо глосарій і всі слова коректні. Такий синсет 
відсилається на перевірку модератору, який підтверджує правильність синсету, або 
повертає його назад на доопрацювання. 

Всі внесені модератором правки відображаються редактору. Наприклад, якщо 
два з трьох слів синсету відмічено як некоректні, то синсет повертається автору-редак- 
тору з відповідними маркерами, що позначають некоректні слова, які потребують до- 
опрацювання. Аналогічно працює маркер «опис коректний»: якщо його було знято 
модератором, то редактору буде показано відсутність маркера. В складних випадках 
модератор з редактором проводять дискусію у коментарях. 

Закінчити роботу з синсетом можна двома методами: кнопкою «Зберегти зміни 
і перейти до наступного синсету», якщо внесені корективи необхідно зберегти в онто- 
логії; або кнопкою «Перейти до наступного синсету без збереження», якщо користувачу 
потрібно відмінити внесені зміни. 


2.2 Модерація 


Щодо модерації синсету існує ряд вимог та рекомендацій, основними серед яких 
є наступні: 

1. При оцінці глосарію модератор повинен оцінити відповідність англійського 
і українського варіантів глосарія синсету, при цьому структура англійського глосарія 
повинна бути збережена в українському варіанті. 

Варіанти роботи модератора з глосарієм: 

- глосарій містить вірний за змістом переклад 1 являє собою стилістично коректне 
речення. В даному випадку немає необхідності вносити корективи; 
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- якщо глосарій містить незначні помилки (невірно узгодженні відмінки слів, 
пропущену літеру в слові 1 т.і.), то глосарій повинен бути виправленим модератором. 
Виключенням можуть бути лише глосарії, що містять надмірну кількість незначних 
помилок; 

- невірний переклад або переклад з великою кількістю помилок. У даному випад- 
ку модератор знімає відмітку про коректність опису і синсет повертається назад ре- 
дактору, що працював з ним. 

2. Для оцінки слів модератору необхідно переглянути англомовний список слів 
та оцінити точність їх змістовного перекладу на українську мову. Кожному англійсь- 
кому слову повинно відповідати не менше одного україномовного варіанта. 

Варіанти роботи модератора зі словами: 

- якщо всі слова перекладено вірно, то необхідності вносити корективи немає; 

- якщо у словах є незначні помилки, то модератору рекомендується самостійно 
виправити недоліки; 

- у випадках, коли частину слів перекладено невірно, модератор має відмітити 
всі некоректні слова позначкою помилки; 

- у випадках, коли всі слова перекладено невірно, модератор має скористатися спе- 
ціальною кнопкою «Коректних немає»; 

-- якщо і глосарій, і слова синсету перекладено невірно, то модератору рекомен- 
дується скористатися спеціальним маркером «відправити синсет повністю на доопра- 
цювання». Після збереження глосарій 1 всі слова синсету буде позначено як некоректні, 
а сам синсет буде відправлено на повторну обробку автору-редактору. 

Всі ухвалені модератором синсети вважаються вірними до того моменту, доки 
в них не знайдено помилки адміністратором системи. 


3 Результати 


Основним результатом проведеної роботи є онтологія української мови. На момент 
написання статті нами повністю опрацьовано всі синсети групи іменників - близько 
80 тисяч одиниць. Наразі ведеться робота над синсетами інших частин мови: дієсловами, 
прикметниками та прислівниками. 

В процесі роботи над онтологією виникло багато питань як методологічного, 
так 1 прикладного характеру. Методологічні питання, в основному, було зосереджено 
навколо принципів адаптації різних груп синсетів. До основних рішень даної катего- 
рії можна віднести наступні: 

- збереження вихідної структури глосарія, в т.ч. збереження прикладів використан- 
ня терміна 1 додаткової інформації про поняття, що описується синсетом; 

- заборона використання складнопідрядних, складносурядних речень та інших 
складних структур у списку слів синсету. Допускається використання слів та слово- 
сполучень з двох і більше слів; 

- кількість слів в україномовному варіанті синсету не може бути меншою за кіль- 
кість слів в англомовному синееті. З даного правила існують виключення, пов'язані з тим, 
що деякі поняття в англійській мові описуються більшою кількістю синонімів, ніж відпо- 
відні поняття в українській мові. Також існує ряд спеціальних ситуацій: 

- прізвища російських або українських письменників, що мають декілька різних 
написань в англійській мові, і лише одне в українській; 

-- латинські терміни (назви тварин, рослин, елементи біологічної класифікації 1 т.д.) 
не підлягають перекладу; 
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- деякі слова англійської мови можна лише транслітерувати, реалії перекладають- 
ся на українську мову у вигляді опису поняття; 

- трирівнева система контролю якості. Як показав наш досвід, якість отри- 
маних знань більше залежить від правильності процесу оцінювання даних, ніж від рівня 
експертів, що корегують синсет. Справа в «людському факторі», адже навіть найбільш 
підготовлена людина допускає помилки. Тому необхідна багаторівнева система контро- 
лю, що має можливості для повернення синсетів на дообробку з наданням інфор- 
мації про причини. Використання такої системи дозволяє значно знизити кількість 
помилок та виявити на ранньому етапі систематичні помилки користувача, що дозволяє 
запобігти їх виникненню в майбутньому; 

- кількість експертів з контролю якості зменшується від рівня до рівня, а їх ква- 
ліфікація зростає, тому на верхньому рівні нами додатково використовуються автома- 
тичні метрики та шаблони для виявлення помилок. Після перевірки експертом точності 
роботи такого шаблону на невеликій кількості даних, шаблон використовується на всьо- 
му масиві знань для автоматичного повернення на доопрацювання синсетів з помил- 
ками. 

До питань прикладного характеру відносяться питання безпеки, способу доступу 
та особливості використання системи. Серед них: 

- обов'язкова авторизація кожного користувача, як з метою забезпечення відпо- 
відності його профілю до рівня доступу, так і для можливості відстеження внесених 
змін. Дане рішення дозволяє автоматично виявити та відмінити одразу всі зміни, 
внесені несумлінними користувачем; 

- захищений доступ до системи. В перших версіях клієнт-онтокоректор розроб- 
лявся у вигляді |ауа-додатку, для забезпечення кросплатформеності рішення. Проте, 
зама-додатки легко декомпілюються та розбираються на складові частини, не зважаю- 
чи на використання обфускації. Отримані таким чином функції для роботи з сервером 
можуть бути використані порушником для створення власних програм з нецільового 
використання онтології та для пошкодження даних; 

- як випливає з попереднього пункту, система обов'язково повинна мати механізми 
відстеження та збереження змін, для повернення в попередній стан. 


Висновки 


Описана в статті утиліта дозволила в рамках проекту (|ЛУМ реалізувати планомір- 
ний, контрольований та ефективний процес створення україномовної онтології. На даний 
момент виконано більше половини роботи з наповнення бази знань і здобуто важли- 
вий досвід, котрий дозволяє стверджувати, що протягом найближчих років роботу буде 
завершено. Дослідження онтології вже зараз вказують на необхідність проведення до- 
даткового аналізу та, особливо, верифікації побудованої онтології з метою підвищен- 
ня якості деяких її сегментів, що буде зроблено в наших наступних дослідженнях. 


Література 


1. Гладун А.Я. Онтологий в корпоративньжх системах. Часть П / А.Я. Гладун, Ю.В. Рогушина // 
«Корпоративнье системьт». - 2006. - Хо 1. - С. 48-56. 
2. Соте7-Реге7 А. Опіоіору Епеіпеегіпе, / А. Соте7-Реге7, М. Кегпапдо-І оре», О. Согсфо // Зргіпоег - 
Уегіає. - 2004. 

. Напфроок оп Опооїіовіез / |З51ааб 5., 5кидег В. (ед5).| // Зргіпеег - Уегіає. - 2004. 

4. Деппу М. Опіоіоєу Тоосія 5шгусу, Вемізіїса / М. Рреппу |Блектронний ресурсі. - 2004. - Режим 
доступу : рЕр://лумуму хіпі сопа/риб/а/2004/07/14/опіо.Біті. 

5. Ріек Моз5еп(ед) КигоМогаХМеї: А Миїшпєцаї Даїабазе мії ІГехіса! Зептапіїс. - Меїмогкя КІимуег 
Асадетіс Рибізпег8я, Погагесіі, 1998. 


9 


«Штучний інтелект» 2013 Мо 4 233 


зн Никоненко А.О., Лиман К.С., Забєлін Є.В., Рибачок Б.О. 


6. Сгієогіадой, М., 2002. - Ваїкапеє А Миїшнпемаї З5еплапіїс Мебмогк бог Ваїкап Гапяемаєеся / |5іатои 5., 
Оба»ег К., Раіа К. еф ай Ї. : а Ргосеедіпєз8 об'Фе 158 СТобаї! МогаМеї Сопіегепсе, Музоге, аа. 

7. Сеогре А. МіЙег. М/огаМес: А І.ехіса! Раїабазе їог Епеїї5б / Сеогое А. МіШег // Сопатпипісабоп5 ої Фе 
АСМ. - Мої. 38, Мо 11. - Р. 39-41. 

8. Никоненко А.О. Проект ОМУМ: Досвід створення універсальної онлайн онтології української 
мови / А.О. Никоненко // Тези міжнародної наукової конференції І5МСТ2011 «Интеллектуальньеєе 
системьт принятия решений и проблемьт вьтчислительного интеллекта». -- Євпаторія, Крим, Україна, 
2011. -С. 92-96, 

9. Анісімов А.В. |ЛУМ: Універсальна онтологічна база знань української мови / О.О. Марченко, 
А.О. Никоненко // Проблеми програмування. - 2012. - Мо 2 - 3. - С. 348-355. 

10. Сайт проекту ОЛУМ |Електронний ресурсі. - Режим доступу : Бир.// пруоуогК5.ого.ма 


І Леегагига 


1. Сіадип А.).Опіоїовіеє ог епіегргі5є арріїсайоп5. Рагі П / А.). СІадип, У. Коєцяпіта // таваліпе 

«Согрогаїе 5узіет5». - 2006. - Мо 1. - Р. 48-56. 

Соте?-Реге7 А., Еегпапдо-Щ орех М., Согсро О. Опіоіору Епаїпеегіпя // 5ргіпоег -Уегіає, 2004. 

Зіааб 5., 5кидег В. (ед8). Напароок оп Опіоіовіея // ЯЗргіпеег - Мегіає, 2004. 

ГДеппу М. Опіоіору Тооіз Зигусу, Кеуізікед // пир://лумуму ха. сопа/риб/а/2004/07/14/опіо риті. - 2004. 

Ріек Моз5еп(ед) ЕигоМ/огдаМеєс А Миїшпєца! ДРагабазе їі Іехіса! Зеплапіїс. Меїмогік5 КІиууег 

Асадетіс Рибійзрег8, Прогагесіі, 1998. 

6. З5іаштош 5. Оба7ег К., Раіа К., СПгізкодошіакія РД., Стізіса РД., Тийз Д., Коеуа 5., Тої-Коу С., 
Дшоїї Р., Стівбогіадоп М. 2002. «Ваїкапес: А Миїипома! 5етапіїс МебмогК їог Ваїкап Г апецаєс5». 
Іа Ргосеедіпез об'Фе 158 СІоба! МогаМеє Сопіегепсе, Мувоге, аа. 

7. Сеогре А. МіЙег (1995), МогаМег: А І.ехіса! Дагабазе Гог Епеі15в. Сопатипісайопя ої Пе АСМ УоОі. 38, 
Хо 11: 39-41. 

8. МуКкопепКко А. ДЛУМ Ргоіесі: |Жгаїпіап Іапомаєє ипіуегза! опіїпе опіоїобу сгеайоп ехрегіепсе // 
Ргосеедіпо5 ої Піегпайопа! Сопісгепсе Т)0МСТГ2011 "ІпіеШієєпі десізіоп-птакіпє зузіегі5 апа Ше 
ргобіетя ої сопарикайопа! іптеШяепсе?, Еурабогіа, Сгітаеа, ОКгаїпе, 2011 - Р. 92-96, 

9. Апізітом А.М., О.А. МагспепКо, А. МукопепКко |ЛУМ: ПЮпіуегза! опіоіїовіса! кпоміедяе Базе ої Ше 
ТОкгаїпіап Іапоцаєе // Топгпа! "Ргобіет5 ої Рговгатитіпе" - 2012. - Мо 2 - 3. - Р. 348-355. 

10. ОМУМ Ргоуесі ууебраєе // Пір/ЛіпоуомогКя.оге па 


ул 


ВЕ5СМЕ 
А.О. Мікопепко, К.5. Гутап, Е.У. Хабеїп, В.О. Кураспок 


СИМ: Опіосогтесіог аз а Тоої ог (Кгаїпіап Гапецаєє Піпецізііс 
Опіоіоєу Стгеапоп 


Тре агіїсіє декаї5 їБе ОКкгаїпіап Іапецаєє опіоїоєу сгеабіпє ргосе55 ип5іпє бресіа! 
опіосоттесіог 001. ТБе ехрегіепсе баїпед іп їБе опіоїобу адаріайоп ргосе58, агспіїесіиге 
разіс ргіпсіріез апа іЧеаз8 аге дезсгібед. МесПпапієтя ої іпіегасійоп Бебуееп сПепі апа 5егуег 
арріпсаноп5, ргосгат Іобіс Феріоутепі, гезропзібійсіе5 апа сарабішиез ої еасп подціе аге 
дейпеад їп декаї!. ТРе 5ігискиге ої Бе 5узіет аз а мПоїе, її5 Базіс еЇетепіз (пр (о Ше сПепі 
аррісаноп сіаз5е5) апа (Беїг ригробе аге сопзідегей. ТБе таїп сраЙепеез апа гі5К5 іпудІувй 
їп плакіпє цп5е об'їБе ційсу аге ідепіїйед. 

Тре опіоїоєу сгеакіоп ргосе85 ц5іпє (Бе опіосоггесіог дезсгірей 15 бе з5ерагаїе 
зесіїоп. ТБе паїп едійиє апа уаПпдайоп ргіпсірієє аге Пягед. НієБіІу еНесіїує тоаеі ої 
паційї-Іеуе! гезиії апаЇу5і5 і5 обегед апа ргасіїсаЙу ргоуеп. Еаїйпє, плодегабіпо апі 
адпаитізітайто, аге Кеу Іеуеіз ої Віз тлодеї. ТБе агіїсіе декаїія "Пе кепі, гезропзібШку апа 
орегайоп ргіпсіріез ої еасі ої Бе ргорозед Іеусіз. Етедцепі егттогя апа адаріайоп 5ресійс 
согаріехтіїез аге Пигіег соп51дегей. ТБе таїп уаїше ої їБе дезсгібеай 5узієт 15 її5 ргасітса! 
арріїсабШку, гезіед муїбіп «Бе ргоїесі ОМУМ. ТБі8 00! пакез роз58іїбіе го йпріетепі а 
ріаппед, сопітоПед апа еїйстепі ргосез5 ої сгеайпе ОКтатіап Іапопаєє опіоіову. 


Стаття надійшла до редакції 22.04.2013. 
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